Actualmente, estamos presenciando un gran cambio en el proceso de generación de las imágenes. El reciente y abundante crecimiento del aprendizaje automático y la inteligencia artificial plantea ciertos interrogantes sobre la manera en que los procesos creativos evolucionan y se desarrollan a través de la tecnología. Los sistemas como DALL-E, DALL-E 2 y Midjourney son programas de inteligencia artificial que están capacitados para generar imágenes a partir de descripciones de texto, utilizando un conjunto de datos que reúne pares de texto e imagen. El conjunto diverso de capacidades incluye la creación de versiones antropomórficas de animales y objetos, la combinación de conceptos no relacionados de manera plausible y la aplicación de transformaciones a imágenes existentes.
DALL-E y sistemas similares pueden crear imágenes plausibles para una gran variedad de oraciones que exploran la estructura compositiva del lenguaje. Por un lado, DALL-E cuenta con algunas de las capacidades de un motor de renderizado 3D, pero la diferencia radica en la naturaleza de las entradas. Para el renderizado 3D, la entrada debe especificarse con detalle, mientras que DALL-E a menudo puede "completar los espacios en blanco". A su vez, puede controlar de forma independiente los atributos de un pequeño número de objetos.
Una de las características más emocionantes es la capacidad de combinar conceptos que no están relacionados. Esta capacidad podría tener implicaciones para los campos de la arquitectura y el diseño, ya que la arquitectura y el diseño de productos se inspiran en conceptos aparentemente sin relación. Los modelos generativos de IA alientan a los diseñadores a explorar un mayor número de posibilidades de diseño desde una nueva perspectiva, ya que reducen el tiempo entre la intención y la ejecución. Ofrecen una forma accesible de jugar con los datos e imaginar variaciones de soluciones para los problemas creativos.
Algunos investigadores los llaman “Serendipia artificial ”, sistemas que maximizan la oportunidad de la casualidad, abriendo el rango de capacidades creativas más allá de los métodos clásicos. Los arquitectos ya están experimentando con estas herramientas para explorar temas complejos como la planificación urbana y las posibilidades de los espacios existentes. Otros combinan palabras clave arquitectónicas con clichés de diseño contemporáneo, referencias a la cultura pop y varios estilos artísticos para diseñar edificios, o simplemente, exploran la naturaleza de las tendencias de diseño y la tecnología.
Si bien estos modelos tienen limitaciones, el campo está evolucionando a un ritmo sin precedentes. Recientemente, Apple lanzó Gaudí, un "arquitecto neuronal" que lleva este proceso un paso más adelante al crear escenas en 3D a partir de indicaciones de texto como "sube las escaleras" o "atraviesa el pasillo". Es difícil predecir a dónde nos llevarán estos desarrollos, pero sin embargo su impacto ya se puede sentir. En los campos de la arquitectura y el diseño, estos pueden entenderse como herramientas poderosas para explorar, optimizar y probar diseños creativos rápidamente.